Вернуться на предыдущую страницу

Классификация систем распознавания речи

Авторы: С.А. Федосин, А. Ю. Еремин

Источник: Федосин С.А., Еремин А. Ю. Классификация систем распознавания речи // "ЭЛЕКТРОНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ" электронное научное периодическое издание. — 2010.

Аннотация

В данной работе сделана попытка классификации существующих подходов к решению проблем rлассификация систем распознавания речи


Задача создания надежной системы распознавания речи, устойчивой к шумам, с низкой частотой появления ошибок, является одной из актуальных на сегодняшний день. Технологии распознавания речи появились весьма давно. Хорошо известны исторические работы Дэвиса, Биддульфа и Балашека (1952), Нагаты, Като и Чибы (1962), Зайцева и Тимофеева (1965), Кинга и Тьюниса (1966), Голда (1966), Величко и Загоруйко (1969). Особенно быстро развитие технологии распознавания речи получили после появления устройств цифровой обработки, выполненных в виде микросхем и позволивших создать относительно дешевые распознаватели, работавшие в режиме реального времени. По мере роста вычислительной мощности сначала специализированных акустических, а затем и цифровых сигнальных процессоров усложнялись и совершенствовались алгоритмы, использовавшиеся в системах распознавания речи . Однако точность систем распознавания речи достигла своего пика в 1999 году и с тех пор застыла на месте. Различные тесты показывают, что современные системы общего профиля так и не преодолели уровень распознавания в 80%, тогда как у человека этот показатель составляет 96-98%. Поэтому крайне необходимо продолжать исследования в этой области.

В данной работе сделана попытка классификации существующих подходов к решению этой проблемы. Классификацию систем распознавания речи следует начать с определения основных аспектов этих систем. К таким аспектам можно отнести:

Обобщив все вышесказанное, можно представить приблизительную классификацию систем распознавания речи (рис. 1).

Классификация систем распознавания речи.

Рис. 1. Классификация систем распознавания речи.


Выводы

Анализ основных аспектов систем распознавания речи показал, что в настоящее время не существует универсальной системы, которая бы была самообучаемой, дикторонезависимой, устойчивой к шумам, распознающей слитную речь, способной работать со словарями больших размеров и при этом иметь низкую частоту появления ошибок. Представленная в данной работе классификация систем распознавания речи позволит сузить область исследований в этом направлении при разработке

Литература

  1. Burger S., Sloane Z., Yang. J. Competitive Evaluation of Commercially Available Speech Recognizers in Multiple Languages / Susan Burger, Zachary Sloane, Jie Yang. – Pittsburgh: Carnegie Mellon University, 2006. – 6 p.
  2. Xuedong H. Spoken Language Processing: A Guide to Theory, Algorithm and System Development / Huang Xuedong. – New Jersey: Prentice Hall PTR, 2001. – 1008 p.
  3. Фролов А., Фролов Г., Синтез и распознавание речи. Современные решения [Электронный ресурс] / Александр Фролов, Григорий Фролов. – Электрон. журн. – 2003. – Режим доступа: http://www.frolov-lib.ru
  4. Чесебиев И.А. Компьютерное распознавание и порождение речи / И.А. Чесебиев. – М.: Спорт и культура, 2008 – 128 с